Apprentissage de Concept à partir d’Exemples (très) Ambigus

نویسندگان

  • Dominique Bouthinon
  • Henry Soldano
  • Véronique Ventos
چکیده

Résumé : Dans cet article nous explorons l’incomplétude des données dans le cadre de l’apprentissage de concepts propositionnels. Nous suivons l’idée de H. Hirsh qui étend le paradigme de l’espace des versions : dans cette extension une hypothèse doit être compatible (dans un sens à définir au cas par cas) avec toutes les informations relatives aux exemples. Nous proposons une représentation de ces informations qui rend non seulement compte de situations où les données sont manquntes mais aussi de situations plus générales d’ambiguité dans lesquelles l’exemple est caché au sein d’un ensemble d’instances virtuelles. Nous présentons un nouvel algorithme, LEa, qui apprend un concept DNF (monotone) existentiel à partir d’un ensemble d’exemples ambigus. Nous comparons LEa à J48 et Naive Bayes sur des problèmes usuels rendus incomplets à divers degrés. Mots-clés : Apprentissage de concepts propositionnels, Ambiguité, Données incomplètes.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage de structure des réseaux bayésiens et données incomplètes

Résumé. Le formalisme des modèles graphiques connait actuellement un essor dans les domaines du machine learning. En particulier, les réseaux bayésiens sont capables d’effectuer des raisonnements probabilistes à partir de données incomplètes alors que peu de méthodes sont actuellement capables d’utiliser les bases d’exemples incomplètes pour leur apprentissage. En s’inpirant du principe de ams-...

متن کامل

Identification à la limite de langages dans le cadre d’un bruit systématique

Pour étudier l’apprentissage à partir de données bruitées, il est usuel de se baser sur un modèle de bruit statistique. L’influence du bruit est alors envisagée selon des critères pragmatiques ou eux-mêmes statistiques, en se basant donc sur un paradigme prenant en compte une distribution des données. Dans cet article, nous étudions le bruit comme un phénomène non statistique, en définissant la...

متن کامل

Logiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité

Résumé. La compréhension de textes de spécialité nécessite un étiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textes étudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d’utiliser un étiquetage réalisé par un étiqueteur généraliste, puis d’améliorer cet éti...

متن کامل

Apprentissage de scénarios à partir de séries temporelles multivariées

La construction automatique de scénarios à partir des signaux (séries temporelles) produits par les appareils de surveillance de patients en anesthésie réanimation est le premier pas vers l’élaboration de systèmes de monitoring intelligent. Mais dans ce contexte, les connaissances a priori ne sont pas suffisantes pour orienter efficacement un apprentissage à partir des données complexes que son...

متن کامل

A Study on Learnability for Rigid Lambek Grammars

We present the basic notions of Gold’s learnability in the limit paradigm, a formalization of the cognitive process by which a native speaker infers the rules of the grammar of her own native language through the exposition to a finite sample of sentences generated by that grammar. Then we present Lambek grammars, a formalism issued from categorial grammars which, although not as expressive as ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009